iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 6
0
AI & Data

Machine Learning與軟工是否搞錯了什麼?系列 第 6

Day 6 強化學習就是一直學習?

  • 分享至 

  • xImage
  •  

強化學習就是一直學習?

介紹完監督式學習與非監督式學習,我們來介紹強化學習!根據wiki的定義

強化學習(英語:Reinforcement learning,簡稱RL)是機器學習中的一個領域,強調如何基於環境而行動,以取得最大化的預期利益。
擷取至wiki

可以看到,強化學習的精隨在於agent如何與環境的互動,來產生最大的利益。

簡介

強化學習總共有這幾個元素,Agent,Environment,Action,Reward。


取自https://www.terasoft.com.tw/support/tech_articles/reinforcement_learning_a_brief_guide.asp

Agent會採取Action,採取行動後,環境可能會被改變,而環境會給Agent一個Reward,讓Agent知道這Action好不好。

應用

那麼強化學習有什麼用處呢?
我們可以使用強化學習來訓練圍棋機器人!
知名的Alpha Go 就是基於強化學習來打敗人類的!
又或者學習如何玩超級馬力歐,透過一次又一次的死亡,Agent會慢慢地學習什麼時間點該跳躍閃避怪物,或者殺掉怪物。

那麼強化學習無敵了嗎?

當然不是的,強化學習需要大量的訓練,如果要在電玩遊戲中贏過人類,需要的禎數可能要很高,且例如射擊遊戲需要超高的反應速度,目前的強化學習可能還無法應付。
又或者自動駕駛,假設車子已經能完美的沿著路線前進了,且能應對紅綠燈等狀況,但如果因為某些原因,影像辨識誤把紅燈當成了綠燈,這樣可能會導致嚴重的事故。

結論

強化學習是很有趣的,但可能不是這麼萬用,但在一些領域中,可以達到超過人類水準的表現!

參考資料

強化學習 wiki
AlphaGo使用的強化學習是人工智慧新星?讓專家告訴你為什麼這不是通用解方


上一篇
Day 5 GAN如何實現
下一篇
Day 7 強化學習之Q learning
系列文
Machine Learning與軟工是否搞錯了什麼?30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言